阿里8B模型拿下多页文档理解新SOTA,324个视觉token表示一页,缩减80% 关键词: token,AI,mPLUG-DocOwl 2,多模态大模型,DocOwl 2,模型训练 高效多页文档理解,阿里通义实验室mPLUG团队拿下新SOTA。 来自主题: AI技术研报 5665 点击 2024-09-13 21:27
阿里7B多模态文档理解大模型拿下新SOTA|开源 关键词: 阿里7B,多模态,大模型,mPLUG-DocOwl 1.5 多模态文档理解能力新SOTA!阿里mPLUG团队发布最新开源工作mPLUG-DocOwl 1.5,针对高分辨率图片文字识别、通用文档结构理解、指令遵循、外部知识引入四大挑战,提出了一系列解决方案。 来自主题: AI技术研报 6722 点击 2024-04-02 11:40